2025-02-18 16:55:26.AIbase.
OpenAI lança o benchmark SWE-Lancer: avaliando o desempenho do modelo em trabalhos de engenharia de software freelance do mundo real
2024-08-15 14:53:25.AIbase.
OpenAI lança SWE-bench Verified: aprimorando a avaliação de habilidades de engenharia de software de IA
2023-08-10 10:09:18.AIbase.